Modèles d'information pour la recherche multilingue

نویسندگان

  • Bo Li
  • Éric Gaussier
چکیده

RÉSUMÉ. Nous présentons dans cet article plusieurs extensions multilingues des modèles d’information, en particulier le modèle log-logistique (LL) et le modèle Smoothed Power Law (SPL), récemment introduits en recherche d’information (Clinchant et al., 2010). Ces extensions sont fondées sur (a) une généralisation de la notion d’information utilisée dans ces modèles, (b) une généralisation des variables aléatoires utilisées et (c) une expansion de la requête utilisant l’ensemble des traductions de chaque mot. Nous analysons ensuite ces extensions d’un point de vue théorique, par l’intermédiaire d’une condition que doivent satisfaire les systèmes de recherche d’information multilingue. Cette nouvelle condition permet d’étendre le champ de l’approche axiomatique de la recherche d’information au cadre multilingue. Les résultats expérimentaux, obtenus sur trois collections et trois couples de langue, sont en accord avec l’analyse théorique et montrent que le modèle LL fournit les meilleurs résultats en recherche d’information multilingue.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Fusion de ressources hétérogènes pour la recherche d'information multilingue

RÉSUMÉ. Afin d’améliorer la recherche multilingue dans le moteur de recherche Sinequa Engine, nous avons intégré les connaissances multilingues du service Sensagent au module de requêtes du moteur de recherche Sinequa Engine. L’interface développée propose une extension de la requête aux choix de l’utilisateur par traduction des différents mots dans les langues sélectionnées. Pour limiter le gr...

متن کامل

Expansion de requêtes pour la recherche d'information multilingue

1. Recherche d'information multilingue : approche par traduction des contenus La quantité d'information en ligne croît très rapidement, ainsi que le nombre de langues dans lesquelles ces contenus sont disponibles. En revanche, la complexité des requêtes reste limitée (2 à 3 mots en moyenne). Des traitements spécifiques s'avèrent donc nécessaires pour préciser le sens de certaines requêtes, ou a...

متن کامل

Texte et Représentation en Recherche d'Information

Les performances des modèles de Recherche d'Information (RI) sont for-tement liées à leur capacité à représenter le texte. Ces dernières années, portés par les succès en reconnaissance d'image et de parole, de nombreux modèles basés sur les réseaux de neurones et les représentations distri-buées des mots et phrases sont apparus. Quelques modèles ont essayé d'aborder le problème de la RI, dont u...

متن کامل

Un formalisme pour la gestion des connaissances. Approche ingénierie dirigée par les modèles

RÉSUMÉ. Les nombreux travaux de recherche autour de IDM (ingénierie dirigée par les modèles) montrent que la gestion de modèles prend une importance grandissante et intervient dans divers domaines comme la gestion des connaissances, la gestion de métadonnées, les ontologies, la qualité de service et le génie logiciel. La représentation de modèles est fondamentale pour la gestion de modèles. Com...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2012